15 september 2025Nederlands

Ontdek Python's __slots__ om geheugengebruik drastisch te verminderen en de toegangssnelheid van attributen te verhogen. Een complete gids met benchmarks, afwegingen en best practices.

Python's slots: Een Diepgaande Analyse van Geheugenoptimalisatie en Attribuutsnelheid

In de wereld van softwareontwikkeling zijn prestaties van het grootste belang. Voor Python-ontwikkelaars houdt dit vaak een delicate balans in tussen de ongelooflijke flexibiliteit van de taal en de noodzaak van efficiënt resourcegebruik. Een van de meest voorkomende uitdagingen, vooral in data-intensieve applicaties, is het beheren van geheugengebruik. Wanneer je miljoenen, of zelfs miljarden, kleine objecten aanmaakt, telt elke byte.

Dit is waar een minder bekende maar krachtige feature van Python om de hoek komt kijken: __slots__. Het wordt vaak geprezen als een wondermiddel voor geheugenoptimalisatie, maar de ware aard ervan is genuanceerder. Gaat het alleen om het besparen van geheugen? Maakt het je code echt sneller? En wat zijn de verborgen kosten van het gebruik ervan?

Deze uitgebreide gids neemt u mee op een diepgaande verkenning van Python's __slots__. We ontleden hoe standaard Python-objecten onder de motorkap werken, benchmarken de reële impact van __slots__ op geheugen en snelheid, onderzoeken de verrassende complexiteiten en afwegingen, en bieden een duidelijk kader om te beslissen wanneer—en wanneer niet—u dit krachtige optimalisatiegereedschap moet gebruiken.

De Standaard: Hoe Python-objecten Attributen Opslaan met `dict`

Voordat we kunnen waarderen wat __slots__ doet, moeten we eerst begrijpen wat het vervangt. Standaard heeft elke instantie van een custom class in Python een speciaal attribuut genaamd __dict__. Dit is letterlijk een dictionary die alle attributen van de instantie opslaat.

Laten we naar een eenvoudig voorbeeld kijken: een klasse om een 2D-punt weer te geven.

            import sys

class Point2D:
    def __init__(self, x, y):
        self.x = x
        self.y = y

# Maak een instantie aan
p1 = Point2D(10, 20)

# Attributen worden opgeslagen in __dict__
print(p1.__dict__)  # Output: {'x': 10, 'y': 20}

# Laten we de grootte van de __dict__ zelf controleren
print(f"Grootte van de __dict__ van de Point2D-instantie: {sys.getsizeof(p1.__dict__)} bytes")

De output kan enigszins variëren afhankelijk van uw Python-versie en systeemarchitectuur (bijv. 64 bytes op Python 3.10+ voor een kleine dictionary), maar de belangrijkste conclusie is dat deze dictionary zijn eigen geheugenvoetafdruk heeft, los van het instantieobject zelf en de waarden die het bevat.

De Kracht en de Prijs van Flexibiliteit

Deze __dict__-aanpak is de hoeksteen van de dynamiek van Python. Het stelt u in staat om op elk moment nieuwe attributen aan een instantie toe te voegen, een praktijk die vaak "monkey-patching" wordt genoemd:

            # Voeg een nieuw attribuut on-the-fly toe
p1.z = 30
print(p1.__dict__) # Output: {'x': 10, 'y': 20, 'z': 30}

Deze flexibiliteit is fantastisch voor snelle ontwikkeling en bepaalde programmeerpatronen. Het heeft echter een prijs: geheugenoverhead.

Dictionaries in Python zijn sterk geoptimaliseerd, maar zijn inherent complexer dan eenvoudigere datastructuren. Ze moeten een hash-tabel bijhouden om snelle key-lookups te bieden, wat extra geheugen vereist om potentiële hash-botsingen te beheren en efficiënte schaling mogelijk te maken. Wanneer u miljoenen Point2D-instanties aanmaakt, die elk hun eigen __dict__ dragen, stapelt deze geheugenoverhead zich snel op.

Stel u een applicatie voor die een 3D-model met 10 miljoen vertices verwerkt. Als elk vertex-object een __dict__ van 64 bytes heeft, is dat 640 megabyte aan geheugen dat alleen al door de dictionaries wordt verbruikt, nog voordat we de daadwerkelijke integer- of float-waarden die ze opslaan meerekenen! Dit is het probleem waarvoor __slots__ is ontworpen.

Introductie van `slots`: Het Geheugenbesparende Alternatief

__slots__ is een klassevariabele waarmee u expliciet de attributen kunt declareren die een instantie zal hebben. Door __slots__ te definiëren, vertelt u Python in feite: "Instanties van deze klasse zullen alleen deze specifieke attributen hebben. U hoeft geen __dict__ voor hen aan te maken."

In plaats van een dictionary, reserveert Python een vaste hoeveelheid ruimte in het geheugen voor de instantie, net genoeg om pointers naar de waarden voor de gedeclareerde attributen op te slaan, vergelijkbaar met een C-struct of een tuple.

Laten we onze Point2D-klasse herstructureren om __slots__ te gebruiken.

            class SlottedPoint2D:
    # Declareer de instantie-attributen
    # Het kan een tuple (meest gebruikelijk), lijst of een andere iterable van strings zijn.
    __slots__ = ('x', 'y')

    def __init__(self, x, y):
        self.x = x
        self.y = y

Op het eerste gezicht ziet het er bijna identiek uit. Maar onder de motorkap is alles veranderd. De __dict__ is verdwenen.

            p_slotted = SlottedPoint2D(10, 20)

# Poging om __dict__ te benaderen zal een fout genereren
try:
    print(p_slotted.__dict__)
except AttributeError as e:
    print(e) # Output: 'SlottedPoint2D' object has no attribute '__dict__'

Benchmarken van de Geheugenbesparing

Het echte "wauw"-moment komt wanneer we het geheugengebruik vergelijken. Om dit nauwkeurig te doen, moeten we begrijpen hoe de grootte van objecten wordt gemeten. sys.getsizeof() rapporteert de basisgrootte van een object, maar niet de grootte van de zaken waarnaar het verwijst, zoals de __dict__.

            import sys

# --- Reguliere Klasse ---
class Point2D:
    def __init__(self, x, y):
        self.x = x
        self.y = y

# --- Klasse met Slots ---
class SlottedPoint2D:
    __slots__ = ('x', 'y')
    def __init__(self, x, y):
        self.x = x
        self.y = y

# Maak één instantie van elk om te vergelijken
p_normal = Point2D(1, 2)
p_slotted = SlottedPoint2D(1, 2)

# De grootte van de slotted instantie is veel kleiner
# Het is doorgaans de basisgrootte van het object plus een pointer voor elke slot.
size_slotted = sys.getsizeof(p_slotted)

# De grootte van de normale instantie omvat de basisgrootte en een pointer naar zijn __dict__.
# De totale grootte is de instantiegrootte + de __dict__-grootte.
size_normal = sys.getsizeof(p_normal) + sys.getsizeof(p_normal.__dict__)

print(f"Grootte van een enkele SlottedPoint2D-instantie: {size_slotted} bytes")
print(f"Totale geheugenvoetafdruk van een enkele Point2D-instantie: {size_normal} bytes")

# Laten we nu de impact op schaal bekijken
NUM_INSTANCES = 1_000_000

# In een echte applicatie zou u een tool als memory_profiler gebruiken
# om het totale geheugengebruik van het proces te meten.
# We kunnen de besparing schatten op basis van onze berekening voor een enkele instantie.

size_diff_per_instance = size_normal - size_slotted
total_memory_saved = size_diff_per_instance * NUM_INSTANCES

print(f"\nAanmaken van {NUM_INSTANCES:,} instanties...")
print(f"Geheugen bespaard per instantie door __slots__ te gebruiken: {size_diff_per_instance} bytes")
print(f"Geschatte totale geheugenbesparing: {total_memory_saved / (1024*1024):.2f} MB")

Op een typisch 64-bit systeem kunt u een geheugenbesparing van 40-50% per instantie verwachten. Een normaal object kan 16 bytes voor zijn basis + 8 bytes voor de __dict__-pointer + 64 bytes voor de lege __dict__ in beslag nemen, wat neerkomt op 88 bytes. Een slotted object met twee attributen heeft mogelijk slechts 32 bytes nodig. Dit verschil van ~56 bytes per instantie vertaalt zich naar 56 MB besparing voor een miljoen instanties. Dit is geen micro-optimalisatie; het is een fundamentele verandering die een onhaalbare applicatie haalbaar kan maken.

De Tweede Belofte: Snellere Toegang tot Attributen

Naast geheugenbesparingen wordt __slots__ ook geprezen voor het verbeteren van de prestaties. De theorie is solide: toegang krijgen tot een waarde via een vaste geheugenoffset (zoals een array-index) is sneller dan een hash-lookup uitvoeren in een dictionary.

__dict__ Toegang: obj.x omvat een dictionary-lookup voor de sleutel 'x'.
__slots__ Toegang: obj.x omvat een directe geheugentoegang tot een specifieke slot.

Maar hoeveel sneller is het in de praktijk? Laten we Python's ingebouwde timeit-module gebruiken om erachter te komen.

            import timeit

# Setup-code die eenmaal wordt uitgevoerd voor de timing
SETUP_CODE = """
class Point2D:
    def __init__(self, x, y):
        self.x = x
        self.y = y

class SlottedPoint2D:
    __slots__ = 'x', 'y'
    def __init__(self, x, y):
        self.x = x
        self.y = y

p_normal = Point2D(1, 2)
p_slotted = SlottedPoint2D(1, 2)
"""

# Test attribuut lezen
read_normal = timeit.timeit("p_normal.x", setup=SETUP_CODE, number=10_000_000)
read_slotted = timeit.timeit("p_slotted.x", setup=SETUP_CODE, number=10_000_000)

print("--- Attribuut Lezen ---")
print(f"Tijd voor __dict__ toegang: {read_normal:.4f} seconden")
print(f"Tijd voor __slots__ toegang: {read_slotted:.4f} seconden")
speedup = (read_normal - read_slotted) / read_normal * 100
print(f"Versnelling: {speedup:.2f}%")

print("\n--- Attribuut Schrijven ---")
# Test attribuut schrijven
write_normal = timeit.timeit("p_normal.x = 3", setup=SETUP_CODE, number=10_000_000)
write_slotted = timeit.timeit("p_slotted.x = 3", setup=SETUP_CODE, number=10_000_000)

print(f"Tijd voor __dict__ toegang: {write_normal:.4f} seconden")
print(f"Tijd voor __slots__ toegang: {write_slotted:.4f} seconden")
speedup = (write_normal - write_slotted) / write_normal * 100
print(f"Versnelling: {speedup:.2f}%")

De resultaten zullen aantonen dat __slots__ inderdaad sneller is, maar de verbetering ligt doorgaans in de orde van 10-20%. Hoewel niet onbeduidend, is het veel minder dramatisch dan de geheugenbesparing.

Belangrijkste Conclusie: Gebruik __slots__ voornamelijk voor geheugenoptimalisatie. Beschouw de snelheidsverbetering als een welkome, maar secundaire, bonus. De prestatiewinst is het meest relevant in strakke lussen binnen rekenintensieve algoritmes waar miljoenen keren toegang wordt verkregen tot attributen.

De Afwegingen en Valkuilen: Wat U Verliest met `slots`

__slots__ is geen gratis lunch. De prestatiewinsten gaan ten koste van flexibiliteit en introduceren enige complexiteit, vooral met betrekking tot overerving. Het begrijpen van deze afwegingen is cruciaal om __slots__ effectief te gebruiken.

1. Verlies van Dynamische Attributen

Dit is het meest significante gevolg. Door de attributen vooraf te definiëren, verliest u de mogelijkheid om tijdens runtime nieuwe toe te voegen.

            p_slotted = SlottedPoint2D(10, 20)

# Dit werkt prima
p_slotted.x = 100

# Dit zal mislukken
try:
    p_slotted.z = 30 # 'z' was niet in __slots__
except AttributeError as e:
    print(e) # Output: 'SlottedPoint2D' object has no attribute 'z'

Dit gedrag kan een feature zijn, geen bug. Het dwingt een strikter objectmodel af, voorkomt onbedoelde aanmaak van attributen en maakt de "vorm" van de klasse voorspelbaarder. Echter, als uw ontwerp afhankelijk is van dynamische toewijzing van attributen, is __slots__ geen optie.

2. De Afwezigheid van `dict` en `weakref`

Zoals we hebben gezien, voorkomt __slots__ de aanmaak van __dict__. Dit kan problematisch zijn als u moet werken met bibliotheken of tools die afhankelijk zijn van introspectie via __dict__.

Op dezelfde manier voorkomt __slots__ ook de automatische aanmaak van __weakref__, een attribuut dat nodig is om een object zwak te kunnen refereren. Zwakke referenties zijn een geavanceerd hulpmiddel voor geheugenbeheer dat wordt gebruikt om objecten te volgen zonder te voorkomen dat ze door de garbage collector worden opgeruimd.

De Oplossing: U kunt '__dict__' en '__weakref__' expliciet opnemen in uw __slots__-definitie als u ze nodig heeft.

            class HybridSlottedPoint:
    # We krijgen geheugenbesparing voor x en y, maar hebben nog steeds __dict__ en __weakref__
    __slots__ = ('x', 'y', '__dict__', '__weakref__')

    def __init__(self, x, y):
        self.x = x
        self.y = y

p_hybrid = HybridSlottedPoint(5, 10)
p_hybrid.z = 20 # Dit werkt nu, omdat __dict__ aanwezig is!

print(p_hybrid.__dict__) # Output: {'z': 20}
import weakref
w_ref = weakref.ref(p_hybrid) # Dit werkt nu ook
print(w_ref)

Het toevoegen van '__dict__' geeft u een hybride model. De geslotte attributen (x, y) worden nog steeds efficiënt afgehandeld, terwijl alle andere attributen in de __dict__ worden geplaatst. Dit doet een deel van de geheugenbesparing teniet, maar kan een nuttig compromis zijn om flexibiliteit te behouden terwijl de meest voorkomende attributen worden geoptimaliseerd.

3. De Complexiteit van Overerving

Dit is waar __slots__ lastig kan worden. Het gedrag verandert afhankelijk van hoe ouder- en kindklassen zijn gedefinieerd.

Enkelvoudige Overerving

Als een ouderklasse __slots__ heeft, maar de kindklasse niet: De kindklasse erft het geslotte gedrag voor de attributen van de ouder, maar zal ook zijn eigen __dict__ hebben. Dit betekent dat instanties van de kindklasse groter zullen zijn dan instanties van de ouder.

            class SlottedBase:
    __slots__ = ('a',)

class DictChild(SlottedBase):
    # Geen __slots__ hier gedefinieerd
    def __init__(self):
        self.a = 1
        self.b = 2 # 'b' wordt opgeslagen in __dict__

c = DictChild()
print(f"Kind heeft __dict__: {hasattr(c, '__dict__')}") # Output: True
print(c.__dict__) # Output: {'b': 2}

Als zowel de ouder- als de kindklasse __slots__ definiëren: De kindklasse zal geen __dict__ hebben. De effectieve __slots__ zullen de combinatie zijn van de eigen __slots__ en die van de ouder.

            class SlottedBase:
    __slots__ = ('a',)

class SlottedChild(SlottedBase):
    __slots__ = ('b',) # Effectieve slots zijn ('a', 'b')
    def __init__(self):
        self.a = 1
        self.b = 2

sc = SlottedChild()
print(f"Kind heeft __dict__: {hasattr(sc, '__dict__')}") # Output: False
try:
    sc.c = 3 # Genereert AttributeError
except AttributeError as e:
    print(e)

Belangrijk: Als de __slots__ van een ouder een attribuut bevat dat ook in de __slots__ van het kind staat, is dit redundant maar over het algemeen onschadelijk.

Meervoudige Overerving

Meervoudige overerving met __slots__ is een mijnenveld. De regels zijn strikt en kunnen tot onverwachte fouten leiden.

De Kernregel: Om een kindklasse __slots__ effectief te laten gebruiken (d.w.z. zonder een __dict__), moeten al haar ouderklassen ook __slots__ hebben. Als zelfs één ouderklasse geen __slots__ heeft (en dus een __dict__ heeft), zal de kindklasse ook een __dict__ hebben.

De `TypeError`-valkuil: Een kindklasse kan niet overerven van meerdere ouderklassen die beide niet-lege __slots__ hebben.

            class SlotParentA:
    __slots__ = ('x',)

class SlotParentB:
    __slots__ = ('y',)

try:
    class ProblemChild(SlotParentA, SlotParentB):
        pass
except TypeError as e:
    print(e)
    # Output: multiple bases have instance lay-out conflict

Deze beperking bestaat omdat de geheugenlay-out voor geslotte objecten wordt vastgelegd bij het aanmaken van de klasse. Python kan geen consistente en eenduidige geheugenlay-out creëren die de slots van twee onafhankelijke ouderklassen combineert.

Het Oordeel: Wanneer `slots` wel en niet te Gebruiken

Met een duidelijk begrip van de voordelen en nadelen, kunnen we een praktisch besluitvormingskader opstellen.

Groene Vlaggen: Gebruik `slots` Wanneer...

U een enorm aantal instanties aanmaakt. Dit is het primaire gebruiksscenario. Als u te maken heeft met miljoenen objecten, kan de geheugenbesparing het verschil zijn tussen een applicatie die draait en een die crasht.
De attributen van het object vastliggen en van tevoren bekend zijn. __slots__ is perfect voor datastructuren, records of pure dataobjecten waarvan de "vorm" niet verandert.
U zich in een geheugenbeperkte omgeving bevindt. Dit omvat IoT-apparaten, mobiele applicaties of servers met een hoge dichtheid waar elke megabyte kostbaar is.
U een prestatieknelpunt optimaliseert. Als profilering aantoont dat toegang tot attributen binnen een strakke lus een significante vertraging is, kan de bescheiden snelheidsboost van __slots__ de moeite waard zijn.

Veelvoorkomende Voorbeelden:

Nodes in een grote graaf- of boomstructuur.
Deeltjes in een natuurkundige simulatie.
Objecten die rijen uit een grote databasequery vertegenwoordigen.
Event- of berichtobjecten in een systeem met hoge doorvoer.

Rode Vlaggen: Vermijd `slots` Wanneer...

Flexibiliteit essentieel is. Als uw klasse is ontworpen voor algemeen gebruik of als u afhankelijk bent van het dynamisch toevoegen van attributen (monkey-patching), blijf dan bij de standaard __dict__.
Uw klasse deel uitmaakt van een openbare API die bedoeld is voor subclassing door anderen. Het opleggen van __slots__ aan een basisklasse legt beperkingen op aan alle kindklassen, wat een onwelkome verrassing kan zijn voor uw gebruikers.
U niet genoeg instanties aanmaakt om het verschil te maken. Als u slechts een paar honderd of duizend instanties heeft, zal de geheugenbesparing verwaarloosbaar zijn. Het toepassen van __slots__ is hier een voortijdige optimalisatie die complexiteit toevoegt zonder reëel voordeel.
U te maken heeft met complexe meervoudige overervingshiërarchieën. De TypeError-beperkingen kunnen __slots__ meer problemen opleveren dan het waard is in deze scenario's.

Moderne Alternatieven: Is `slots` Nog Steeds de Beste Keuze?

Het ecosysteem van Python is geëvolueerd, en __slots__ is niet langer het enige hulpmiddel voor het creëren van lichtgewicht objecten. Voor moderne Python-code zou u deze uitstekende alternatieven moeten overwegen.

`collections.namedtuple` en `typing.NamedTuple`

Namedtuples zijn een factory-functie voor het creëren van tuple-subklassen met benoemde velden. Ze zijn ongelooflijk geheugenefficiënt (zelfs meer dan geslotte objecten omdat ze onderliggend tuples zijn) en, cruciaal, onveranderlijk (immutable).

            from typing import NamedTuple

# Creëert een onveranderlijke (immutable) klasse met type hints
class Point(NamedTuple):
    x: int
    y: int

p = Point(10, 20)
print(p.x) # 10
try:
    p.x = 30 # Genereert AttributeError: can't set attribute
except AttributeError as e:
    print(e)

Als u een onveranderlijke datacontainer nodig heeft, is een NamedTuple vaak een betere en eenvoudigere keuze dan een geslotte klasse.

Het Beste van Twee Werelden: `@dataclass(slots=True)`

Geïntroduceerd in Python 3.7 en verbeterd in Python 3.10, zijn dataclasses een game-changer. Ze genereren automatisch methoden zoals __init__, __repr__, en __eq__, wat de hoeveelheid boilerplate-code drastisch vermindert.

Cruciaal is dat de @dataclass-decorator een slots-argument heeft (beschikbaar sinds Python 3.10; voor Python 3.8-3.9 is een bibliotheek van derden nodig voor hetzelfde gemak). Wanneer u slots=True instelt, zal de dataclass automatisch een __slots__-attribuut genereren op basis van de gedefinieerde velden.

            from dataclasses import dataclass

@dataclass(slots=True)
class DataPoint:
    x: int
    y: int

dp = DataPoint(10, 20)
print(dp) # Output: DataPoint(x=10, y=20) - mooie repr gratis!
print(hasattr(dp, '__dict__')) # Output: False - slots zijn ingeschakeld!

Deze aanpak geeft u het beste van alle werelden:

Leesbaarheid en Beknoptheid: Veel minder boilerplate dan een handmatige klassedefinitie.
Gemak: Automatisch gegenereerde speciale methoden besparen u het schrijven van veelvoorkomende boilerplate.
Prestaties: De volledige geheugen- en snelheidsvoordelen van __slots__.
Typeveiligheid: Integreert perfect met het typing-ecosysteem van Python.

Voor nieuwe code geschreven in Python 3.10+, zou `@dataclass(slots=True)` uw standaardkeuze moeten zijn voor het creëren van eenvoudige, veranderlijke (mutable), geheugenefficiënte data-houdende klassen.

Conclusie: Een Krachtig Hulpmiddel voor een Specifieke Taak

__slots__ is een bewijs van Python's ontwerpfilosofie om krachtige tools te bieden aan ontwikkelaars die de grenzen van prestaties moeten verleggen. Het is geen feature om lukraak te gebruiken, maar eerder een scherp, precies instrument voor het oplossen van een specifiek en veelvoorkomend probleem: de hoge geheugenkosten van talloze kleine objecten.

Laten we de essentiële waarheden over __slots__ samenvatten:

Het primaire voordeel is een significante vermindering van het geheugengebruik, waarbij de grootte van instanties vaak met 40-50% wordt verminderd. Dit is de killer feature.
Het biedt een secundaire, meer bescheiden, snelheidsverhoging voor toegang tot attributen, doorgaans rond de 10-20%.
De belangrijkste afweging is het verlies van dynamische toewijzing van attributen, wat een rigide objectstructuur afdwingt.
Het introduceert complexiteit bij overerving, wat een zorgvuldig ontwerp vereist, vooral in scenario's met meervoudige overerving.
In modern Python is `@dataclass(slots=True)` vaak een superieur, handiger alternatief, dat de voordelen van __slots__ combineert met de elegantie van dataclasses.

De gouden regel van optimalisatie is hier van toepassing: profileer eerst. Strooi niet zomaar __slots__ door uw codebase in de hoop op een magische snelheidsboost. Gebruik geheugenprofileringstools om te identificeren welke objecten het meeste geheugen verbruiken. Als u een klasse vindt die miljoenen keren wordt geïnstantieerd en een grote geheugenvreter is, dan—en alleen dan—is het tijd om naar __slots__ te grijpen. Door de kracht en de gevaren ervan te begrijpen, kunt u het effectief hanteren om efficiëntere en schaalbaardere Python-applicaties te bouwen voor een wereldwijd publiek.

Python's __slots__: Een Diepgaande Analyse van Geheugenoptimalisatie en Attribuutsnelheid

De Standaard: Hoe Python-objecten Attributen Opslaan met `__dict__`